查看原文
其他

我用 AI “炼”美人

陆树燊 行者慎思 2023-05-18


《在念咒语炼图的法师》  by  GPT4 + Midjourney + Shens


上一篇文章《我用GPT4 + Midjourney v5把〈三体〉的主角都画出来了》情理之中、意料之外地火出了10w+,首先感谢大家的支持!

文章火了之后,我却发现它造成了一些误解。很多人以为GPT4+Midjourney v5这样的AI神器无所不能,但他们不知道我作为“Prompt(提示词)工程师”,在背后需要反复修改提示词、挑选照片,特别是那些大家觉得像电视剧版本的人们角色,其实不过是我挑出来的……只能说可能是我的认知和审美受到电视剧的影响,而不是AI。

另外,写那篇文章的时候,我使用的Midjourney的功能并不多,我的GPT4那个时候也还没有训练得特别好。这篇文章将会演示一些真实制作AI照片的过程,还讲解AI制图的技巧和方法。相信看完本文,你会对AI生图有更完整的了解。

一则征友启事引发的游戏

故事的开始是这样的,有一天我在一个校友群里,看到朋友发了个征友启事:

这征友启事中虽说强调女主“长得很漂亮”,但是到底有多漂亮呢?我也很好奇。于是乎,我八卦心起,把这段话“喂”给了AI画图神器Midjourney。它给出了4个候选图:

这个结果,怎么说呢。说它懂中文吧,它把大爷都画出来了。说它不懂吧,至少大爷还是对着话筒,命中了“播音主持”这个关键词。不管怎么样,我们对第2、3两个结果进行多次训练,最后挑出了这样两张照片: 

这两个结果已经是我在众多选择中挑出来还过得去的两个了,毕竟人脸是没问题的,手指也是没问题的。虽然两位小姐姐都对着乐器,但我们猜“播音主持专业”的小姐姐应该也能会点乐器吧。(只是这两个乐器确实清新脱俗了。再忽略一下她们背后似是而非的“汉字”,这可能是契丹文字吧。)

我把这个结果发在了朋友圈,并且搞起了一个玩法:让朋友们给我写一段个人描述,我给他们生成一张形象照。

第一个吃螃蟹的人

  • 本节演示中文提示词和英文提示词的区别

第一个客户来了:

于是我故伎重演,结果:不能说它跟描述不太相似,只能说是毫不相关。

对Midjourney的中文理解能力彻底失去信心的我,手工对描述做了翻译,并再次喂给了Mid大师:

A 28 old boy, tall, work in a famous company Tencent Inc. , in the Wechat Pay team, as a Product Manager. He likes free life, often go to surfing and his skin is a little black, his like boxing too --v 5 

这下就靠谱多了!之后的客户就多了起来。

找到平行空间的姐妹和兄弟

一位朋友 @许霄霖 ,她说:

Beautiful and lively woman from Chaozhou, Guangdong, born in 1982, 166 cm tall, graduated in English from Guangdong University of Foreign Studies in 2004, with a strong presence, attractive looks, fair skin, and slightly chubby at around 55 kg. --v 5

当事人觉得这是平行空间的姐妹:

还有一位朋友,原“莉莉丝游戏”产品总监、“轻描淡写科技”CEO吴迪, 他说:

A Chinese handsome 35 years old man, he is from Jiangsu province, he was a programmer, and a game designer, producter. He likes board games and likes studying new technology. --v 5

这两个结果的差异还是挺大的:

AI把他变成了自己的同事

  • 本节演示“喂图/垫图”

一家房地产大数据服务商“禾略中国”的创始人 @郑永祥,他的自我描述是“潮州人,四十五了吧,173cm,78kg,发胖中,创业狗,长期奔波于上海深圳重庆,这些年饱受秃顶之苦。做的是房地产数据分析的工作”,他还跟我强调:不要太假正经,我是比较鬼马快乐的人。

根据他的要求,把GPT4帮我生成的prompt(提示词)提交给Midjourney,两大神器联手给出来的结果,让我实在不好意思发给当事人:

于是我用上了他的一张个人照片:

这还需要用到Midjourney的另外一个功能“喂图”,就是要在提交prompt的同时,带上相关图像的链接。

A 45-year-old Chaozhou man, 173cm tall and weighing 78kg, with a slightly overweight physique. As an entrepreneur, he constantly travels between Shanghai, Shenzhen, and Chongqing. Over the years, he has been troubled by hair loss. He is a humorous and playful person who dislikes being too serious. Do not change his face of https://s.mj.run/CNhCaGiigI --v 5

这里要说明一下,虽然我在prompt中要求“do not change his face”,但其实提供给Midjourney的照片,它只会提取其元素,然后加入到关键词中去生成,而不会真的去将人脸取出来一模一样地合并到图中。它生成图片的命令叫/imagine(想象 ),解读其字面意思也就比较好理解了。

看到结果,当事人说这个照片很像他的一个同事,果然是不是一家人,不进一家门。

让AI替她去海边玩耍

AI公司“文因互联”的市场负责人 @余姗 ,她的自我描述是“162高,55kg,在一家科技公司做市场负责人,她喜欢笑,总是手舞足蹈,会瑜伽,看着疯疯癫癫,长卷发,白色的吊带沙滩裙”,她还说:

收到她消息的时候,我刚好就在海南陵水的海边沙滩躺着,抱着一种罪恶感,我决定满足她的愿望,用了GPT4帮忙生成提示词:

A young woman with a height of 162 cm and a weight of 55 kg, working as a marketing head at a tech company. She has long curly hair, wearing a white strap beach dress, loves to laugh and always dances with joy. At this moment, she is playing on the beach, and her yoga skills make her look energetic. 

结果:

当事人表示非常满意:

让AI替她去海边玩耍,这是多么卑微的职场人啊……有趣的是几天后,她告诉我,她因为工作原因,真的去到了海边,果然向AI许愿是有用的。

图像融合,美人随时可“炼”

  •  本节演示 /blend 命令

我的一位不愿意具名的优秀师姐,没有给我描述词,让我给她生成一张新的照片。我只有她的一张照片,于是我决定用上一个新的玩法:图像融合

Midjourney有一个功能叫 “/blend”,可以把多张图像融合在一起出来新的图像。

首先我要请出来我之前用Midjourney炼出的一个小美女(我叫她 @Betty

与真人照片融合之后,神奇的效果出现了:

还有一位朋友,@魏碧珠 ,她是中山市一所学校的老师,同时还是一名驻唱歌手,一个单身的小姐姐(她说她喜欢阳光、有活力、有共情能力、有责任心的男孩子,欢迎勇敢的男孩子在文章底下留言)。她没有给我个人描述,但她给了我一张很有趣的照片,这张照片上她戴着草帽。 

于是我尝试用喂图的方式,再加上一点场景描述:

A realistic photo by Canon camera, focus on the Chinese girl's face, the girl is walking on the beach, and she has a pitch of flower on her right hand https://s.mj.run/SSwfJSEgYV --v 5 

特别有趣的是,不管怎么切换场景,她的草帽一直在。

把她的照片用/blend命令,和前面的 @Betty 合体,结果Betty也戴上了帽子。

甚至,跟蒙娜丽莎合体,这位来自文艺复兴时期的欧洲贵妇也戴上了中国特色的草帽。 

还原上个世纪30年代的魅力女性

  • 本节演示真正让GPT4和Midjourney v5的联动起来的方式

AI的能力还不只如此。当我把Midjourney的文档、还有一系列优秀的prompt都喂给GPT4,希望它帮我生成一个能让Midjourney画出“一个1930年代的魅力女性”的提示词。GPT4的答案非常惊艳,这里面不只提出了场景要求,描述清楚了细节,还对相机、镜头、光圈、快门一一指明。

An exquisite, high-resolution photograph of a glamorous 1930s female influencer, exuding elegance and sophistication as she poses confidently in a luxurious Art Deco setting. The image showcases her impeccably styled attire, complete with a stunning silk gown, pearl necklace, and a chic feathered hat that perfectly encapsulate the timeless fashion of the era. The photograph is expertly composed using a classic Leica III rangefinder camera paired with a Summar 50mm f/2 lens, renowned for its distinctive bokeh and soft focus that lend a vintage charm to the image. The camera settings are carefully selected to emphasize the subject's alluring features, with an aperture of f/3.5, an ISO of 100, and a shutter speed of 1/60 sec, capturing the subtle interplay of light and shadow that accentuates her captivating expression. The composition is further enriched by the soft, warm lighting that illuminates the scene, casting a gentle glow on the intricate details of the Art Deco architecture and the luxurious textures of the influencer's attire. The final image is a breathtaking homage to the glamour and allure of the 1930s, immortalized in a stunning photographic masterpiece. --ar 4:5 --q 2 --v 5

而Midjourney v5给出的结果更加惊艳:

来自朋友圈的评价

我把上面一部分照片发在朋友圈,这是一些朋友的评价:

彩蛋

还记得《我用GPT4 + Midjourney v5把〈三体〉的主角都画出来了》文章里面的庄颜1号么?很多人都说最喜欢她。

于是我用她的照片,通过“喂图”技术,给她生成了几个姐妹,并且让GPT4给她们分别取了中文名和英文名,取得还真不错:

集齐庄家五朵金花。罗辑的“梦中情人”庄颜的四位姐姐,请您欣赏:

庄婉 Wendy 

庄瑶 Yolanda

庄媛 Yvonne

庄瑜 Yvette

“炼”出了这么多美人(和帅哥),你最喜欢哪一位呢?

One more thing

本周六(23/04/08)下午,在“慎思学社”的视频号直播间,我将和两位知名艺术家:陆蓉之老师、赵伯祚老师一起连麦直播,探讨“美学的AI革命,人人都可以成为艺术家吗?”,欢迎扫码预约起来!


另外,我们和嘉宾赵伯祚老师还合作了一门《AI绘画设计速成班》课程,如果你有兴趣参加,扫描以下二维码后与小助理留言“绘画课”索要课程介绍。


写在最后

  • • 本文首发于公众号“行者慎思”。作者陆树燊,行者慎思科技咨询创始人,微信创始团队成员(微信:shensinside);

  • • 本文显露真实姓名的个人信息、个人照片、成果,均已获得当事人同意;

  • • Midjourney最近又新发布了一个神奇的玩法  /describe,可以实现“image to text”,把图像分析成若干种提示词,用户可以用这些提示词重新生成图像。本文因为篇幅原因就不演示了,以后有机会再来;

  • • 文章标题中讲到的“炼”美人,是因为大家非常形象地把生成图片的prompt(提示词)称为“咒语”,把AI生图戏称为“炼丹”,如本文封面图《在念咒语炼图的法师》,也是我用“咒语”生成的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存